Schur分解
Schur Decomposition Schur 分解
Schur 分解把任意复方阵酉相似到上三角矩阵。对任意
都存在列向量标准正交的 酉矩阵
等价地,
这里
存在性、唯一性与域
复 Schur 分解对任意复方阵都存在,因为复数域中每个特征多项式都有根,归纳构造总能从一个特征向量开始。实方阵若允许复酉矩阵,也可直接使用复 Schur 分解;若要求所有矩阵保持实数,则得到实 Schur 形式,矩阵不再完全上三角,而是准上三角,非实共轭特征值以
Schur 分解一般不唯一。对角线上特征值的顺序可以通过酉相似变换重新排列;重复特征值对应的不变子空间也有基选择自由。真正唯一的是特征值的多重集合,以及在给定排序和不变子空间选择后得到的三角化结构。若
三角形式
因为相似变换保持特征值,而上三角矩阵的特征值就是对角线元素,所以
正是
构造思想
Schur 分解的证明可以用归纳理解。任意复方阵至少有一个特征值
由于
再对右下角的
这个“不变子空间链”是 Schur 分解区别于对角化的关键。对角化要求每个坐标轴都是一维不变子空间;Schur 分解只要求前
与对角化
若
Schur 分解比它更普遍,因为
当
且
一个上三角正规矩阵只能是对角矩阵,所以
因此正规矩阵恰好是那些能被酉矩阵对角化的矩阵。一般非正规矩阵的
与 Jordan 形式
Jordan矩阵 也适用于任意复方阵,但它使用一般可逆矩阵和广义特征向量:
Jordan 形式更接近代数分类,却对扰动很敏感;Schur 分解使用酉相似变换,保持长度与内积,数值上更稳定。实际计算特征值时,通常更偏向 Schur 形式,而不是直接追求 Jordan 形式。
若
本身已经是上三角 Schur 形的一种,但它不能被相似到对角矩阵。Schur 分解的优势正是在这里:它不把不可消除的耦合隐藏起来,而是放在上三角区域。
数值算法语义
QR 特征值算法可以看作逐步逼近 Schur 形式。先分解
再反转因子得到
每一步都是相似变换,所以特征值不变;在合适条件与移位策略下,矩阵会逐渐接近上三角形式,特征值显现在对角线上。
使用酉或正交矩阵的原因是数值稳定:酉相似变换不改变二范数长度,也不放大正交关系。对大型稀疏矩阵,常先化为 Hessenberg 形式,再做 QR 迭代,以降低每步成本。
边界上,Schur 分解不会消除非正规耦合,而是把它压到上三角的非对角区域。若特征值高度重合,
实矩阵情形
若实矩阵允许使用复数酉矩阵,也适用同一个 Schur 分解。若坚持所有矩阵都为实数,则实 Schur 形式通常是准上三角矩阵:实特征值对应
相邻概念
相似矩阵 解释了为什么